selenium技巧 - 不顯示窗口的瀏覽器

selenium可以模擬人的行為,好用歸好用,但如果安裝在server主機上或不想顯示GUI,那有什麼方法?

方法一 無頭瀏覽器hantomJS

PhantomJS是一個真實的無頭瀏覽器,需要另外下載配置到環境變數才能使用。

官方下載

  1. 下載對應的系統版本,加到環境變數中。

  2. python module selenium

新版本已不支持PhantomJS,建議安裝3.4.2版

1
selenium == 3.4.2
  1. python 控制
1
2
3
4
5
6
7
8
9
10
from selenium import webdriver
from PIL import Image
from io import BytesIO
import base64

browser = webdriver.PhantomJS()
browser.get("http://www.google.com")
image_data = browser.get_screenshot_as_base64() # 截圖
i = Image.open(BytesIO(base64.b64decode(image_data)))
i.show() # 顯示截圖

方法二: Chhome headless

Chrome V59 開始推出了headless mode,原生支持無頭環境運行Chrome,速度非常快。

官方文檔

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
from selenium import webdriver
from PIL import Image
from io import BytesIO
import base64

chrome_options = webdriver.ChromeOptions()
chrome_options.add_argument('--headless') # 啟動無頭模式
chrome_options.add_argument('--disable-gpu') # windowsd必須加入此行

browser = webdriver.Chrome(chrome_options=chrome_options)
browser.get("http://www.google.com")

image_data = browser.get_screenshot_as_base64()

i = Image.open(BytesIO(base64.b64decode(image_data)))

i.show()

方法三: XVFB Linux 虛擬桌面

僅適用於linux,支持

安裝方法

1
2
apt-get install Xvfb
pip install pyvirtualdisplay

python 控制

1
2
3
4
5
6
from pyvirtualdisplay import Display
display = Display(visible=0, size=(1024, 768))
display.start()
browser = webdriver.Chrome()
browser.get('http://www.google.com')
print(browser.title)